智能论文笔记

Particle gradient descent model for point process generation

Antoine Brochard , Bartłomiej Błaszczyszyn , Stéphane Mallat , Sixin Zhang

分类： (统计)机器学习 | 机器学习

2020-10-27

本文介绍了一个固定的厄贡点过程的统计模型，该模型是根据在方形窗口中观察到的单个实现估计的。使用随机几何形状中的现有方法，很难用大量颗粒形成复杂的几何形状进行建模。受到采样最大渗透模型的梯度下降算法的最新作品的启发，我们描述了一个模型，该模型允许快速采样新的配置，从而再现了给定观察的统计数据。从初始随机配置开始，其粒子根据能量的梯度移动，以匹配一组规定的矩（功能）。我们的矩是通过相谐波操作员在点模式的小波变换上定义的。它们允许一个人捕获粒子之间的多尺度相互作用，同时按照模型的结构的尺度明确控制矩数。我们介绍了具有各种几何结构的点过程的数值实验，并通过光谱和拓扑数据分析评估模型的质量。

translated by 谷歌翻译

An Ensemble Method to Automatically Grade Diabetic Retinopathy with Optical Coherence Tomography Angiography Images

Yuhan Zheng , Fuping Wu , Bartłomiej W. Papież

分类：计算机视觉

2022-12-12

Diabetic retinopathy (DR) is a complication of diabetes, and one of the major causes of vision impairment in the global population. As the early-stage manifestation of DR is usually very mild and hard to detect, an accurate diagnosis via eye-screening is clinically important to prevent vision loss at later stages. In this work, we propose an ensemble method to automatically grade DR using ultra-wide optical coherence tomography angiography (UW-OCTA) images available from Diabetic Retinopathy Analysis Challenge (DRAC) 2022. First, we adopt the state-of-the-art classification networks, i.e., ResNet, DenseNet, EfficientNet, and VGG, and train them to grade UW-OCTA images with different splits of the available dataset. Ultimately, we obtain 25 models, of which, the top 16 models are selected and ensembled to generate the final predictions. During the training process, we also investigate the multi-task learning strategy, and add an auxiliary classification task, the Image Quality Assessment, to improve the model performance. Our final ensemble model achieved a quadratic weighted kappa (QWK) of 0.9346 and an Area Under Curve (AUC) of 0.9766 on the internal testing dataset, and the QWK of 0.839 and the AUC of 0.8978 on the DRAC challenge testing dataset.

translated by 谷歌翻译

Keyword Extraction from Short Texts with~a~Text-To-Text Transfer Transformer

Piotr Pęzik , Agnieszka Mikołajczyk-Bareła , Adam Wawrzyński , Bartłomiej Nitoń , Maciej Ogrodniczuk

分类：自然语言处理

2022-09-28

该论文探讨了波兰语（PLT5）的文本到文本传输转换器语言模型（T5）与从短文本段落中固有和外在关键字提取的任务。该评估是在新的波兰开放科学元数据语料库（POSMAC）上进行的，该科学与本文一起发布：库里卡特项目中编写的216,214篇科学出版物摘要的集合。我们比较了通过四种不同方法获得的结果，即PLT5KW，Extremetext，temopl，Keybert，并得出结论，PLT5KW模型可为频繁代表的关键字带来特别有希望的结果。此外，在POSMAC上训练的PLT5KW关键字生成模型似乎还可以在跨域文本标签方案中产生非常有用的结果。我们讨论了该模型在新闻故事和基于电话的对话框成绩单上的性能，这些成绩单代表文本流派和科学摘要数据集外部域。最后，我们还试图表征在固有和外部关键字提取上评估文本对文本模型的挑战。

translated by 谷歌翻译

Online Meta-Learning for Model Update Aggregation in Federated Learning for Click-Through Rate Prediction

Xianghang Liu , Bartłomiej Twardowski , Tri Kurniawan Wijaya

分类：人工智能 | 机器学习

2022-08-30

在点击率（CTR）预测的联合学习（FL）中，用户的数据未共享以保护隐私。学习是通过在客户端设备上本地培训进行的，并仅将模型更改传达给服务器。有两个主要的挑战：（i）客户异质性，制作使用加权平均来汇总客户模型更新的FL算法的进步缓慢且学习结果不令人满意；（ii）由于每个实验所需的大量计算时间和资源，因此使用反复试验方法调整服务器学习率的困难。为了应对这些挑战，我们提出了一种简单的在线元学习方法，以学习汇总模型更新的策略，该方法根据客户属性适应客户的重要性并调整更新的步骤大小。我们在公共数据集上进行广泛的评估。我们的方法在收敛速度和最终学习结果的质量方面都大大优于最先进的方法。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Multimodal PET/CT Tumour Segmentation and Prediction of Progression-Free Survival using a Full-Scale UNet with Attention

Emmanuelle Bourigault , Daniel R. McGowan , Abolfazl Mehranian , Bartłomiej W. Papież

分类：人工智能 | 计算机视觉

2021-11-06

头部和颈部（H \＆N）肿瘤的分割和患者结果的预测对于患者的疾病诊断和治疗监测至关重要。强大的深度学习模型的当前发展受到缺乏大型多中心，多模态数据的阻碍，质量注释。 Miccai 2021头部和颈部肿瘤（Hecktor）分割和结果预测挑战产生了一种平台，用于比较氟 - 脱氧葡萄糖（FDG）-PET上的初级总体目标体积的分段方法和计算的断层摄影图像和预测H中的无进展生存对于细分任务，我们提出了一种基于编码器 - 解码器架构的新网络，具有完整的和跳过连接，以利用全尺度的低级和高级语义。此外，我们使用条件随机字段作为优化预测分段映射的后处理步骤。我们训练了多个用于肿瘤体积分割的神经网络，并且这些分段被整合在交叉验证中实现了0.75的平均骰子相似度系数，并在挑战测试数据集中实现了0.76。为了预测患者进展免费生存任务，我们提出了一种组合临床，辐射和深层学习特征的Cox比例危害回归。我们的生存预测模型在交叉验证中实现了0.82的一致性指数，并在挑战测试数据集中获得0.62。

translated by 谷歌翻译